#screening secuencial

Bandits Multi-Brazo con Nuevos Brazos: Arrepentimiento Dinámico

Optimiza experimentos con llegada de nuevas opciones: el algoritmo UCB-AA ofrece arrepentimiento dinámico sublineal y reduce desperdicio de recursos.